Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

11장. 모델 이름 해독법

이 장의 목표 처음 보는 모델 이름이 와도 30초 안에 정체를 파악 할 수 있게 됩니다.

이 장의 결과는 곧 이 책 1~10장의 종합 응용입니다.


11.1 이름은 보통 7가지 정보로 만들어진다

길고 복잡해 보이는 이름도 다음 7개 정보를 조립한 것입니다.

①모델시리즈 ②버전 ③파라미터수 ④유형 ⑤특수기법 ⑥양자화 ⑦포맷

전부 다 적힌 경우는 드물고, 관련된 것만 골라 적습니다.


11.2 예제 1 — Qwen3-32B-Instruct

Qwen 3 - 32B - Instruct
└──┘ │   └─┘   └──────┘
①    ②   ③     ④
부분의미
Qwen모델 시리즈 (Alibaba)
3메이저 버전
32B약 320억 파라미터 (3장)
Instruct지시사항 튜닝 (9장)

→ “Qwen 시리즈 3세대, 320억 파라미터, 일반 대화용”


11.3 예제 2 — Qwen3-32B-Instruct-Q4_K_M.gguf

Qwen3-32B-Instruct - Q4_K_M . gguf
└─────────────────┘  └────┘   └──┘
       기존 정보       ⑥양자화    ⑦포맷
추가 부분의미
Q4_K_M4비트 K-quant Medium (5장)
.ggufGGUF 포맷 (10장)

→ “위 모델의 4비트 양자화 GGUF 파일”


11.4 예제 3 — meta-llama/Llama-3.1-8B-Instruct

meta-llama / Llama-3.1-8B-Instruct
└────────┘   └───┘ └─┘ └─┘ └──────┘
 소유자        ①   ②   ③    ④
부분의미
meta-llamaMeta가 올린 모델 (소유자)
Llama시리즈명
3.1버전 (메이저.마이너)
8B80억 파라미터
Instruct지시사항 튜닝

소유자가 meta-llama 라는 건 원본이라는 뜻입니다 (10장).


11.5 예제 4 — Gemma-3-27B-it

Gemma - 3 - 27B - it
└───┘   │   └─┘   └┘
 ①      ②   ③    ④
부분의미
GemmaGoogle 모델 시리즈
33세대
27B270억 파라미터
itinstruction-tuned (= Instruct)

it 표기는 Google·Gemma 시리즈에서 잘 씁니다. 9장에서 본 그 꼬리표입니다.


11.6 예제 5 — Qwen3-30B-A3B-Instruct-2507

Qwen3 - 30B - A3B - Instruct - 2507
└──┘    └─┘   └─┘   └──────┘   └──┘
 ①+②    ③    ⑤        ④       날짜

새로운 게 두 개 등장.

부분의미
A3BMoE의 활성(Active) 파라미터 3B (14장)
2507출시 날짜 표기 (2025년 7월)

→ “총 30B인데 매 토큰마다 3B만 깨어남. 2025년 7월 버전 Instruct”

날짜 표기는 모델 카드를 잘 안 보면 “같은 모델인데 두 개?” 혼란이 와서 붙는 일이 많습니다.


11.7 예제 6 — DeepSeek-R1-Distill-Qwen-32B

DeepSeek - R1 - Distill - Qwen - 32B
└──────┘   └┘   └─────┘   └──┘   └─┘
   ①       ②      ⑤        ?     ③
부분의미
DeepSeek모델 시리즈 (DeepSeek-AI)
R1추론(Reasoning) 모델 1세대
Distill큰 R1의 능력을 작은 모델로 증류
Qwen베이스로 쓴 모델 (Qwen)
32B베이스의 크기

→ “DeepSeek R1의 능력을 Qwen 32B에 옮겨 담은 reasoning 모델”

Distill: 큰 선생 모델의 답안으로 작은 학생 모델을 가르치는 기법. “큰 모델 똑똑함을 압축한 작은 모델” 이라고 보면 됩니다.


11.8 예제 7 — bartowski/Llama-3.3-70B-Instruct-Q5_K_L-GGUF

bartowski / Llama-3.3-70B-Instruct - Q5_K_L - GGUF
└───────┘   └─────────────────────┘  └────┘   └──┘
 소유자          기존 정보             ⑥양자화   포맷

처음 보는 양자화 Q5_K_L 도 5장에 나왔던 S/M/L 의 L 입니다. “같은 Q5 중에서도 Large = 정보를 더 많이 보존” 한 버전.

→ “bartowski가 양자화한 Llama 3.3 70B Instruct, Q5_K_L GGUF”


11.9 예제 8 — mlx-community/Qwen2.5-VL-32B-Instruct-4bit

mlx-community / Qwen2.5 - VL - 32B - Instruct - 4bit
└───────────┘   └────┘   └┘   └─┘   └──────┘   └──┘
   소유자        ①+②     ④     ③       ④       ⑥
부분의미
mlx-communityMLX 변환본 모음 (10장)
Qwen2.5Qwen 시리즈 2.5
VLVision-Language, 이미지 입력 지원 (9장)
32B320억 파라미터
Instruct지시사항 튜닝
4bitMLX 4비트 양자화 (5장)

→ “Qwen 2.5 VL 32B의 MLX 4비트 버전, 이미지 입력 가능”


11.10 자주 헷갈리는 표기 정리

표기진짜 의미
-itinstruction-tuned (Gemma 계열)
-Chat대화 튜닝
-DPODPO로 정렬한 버전
-Distill큰 모델에서 증류
-AWQ, -GPTQGPU 양자화 (맥에서는 잘 안 씀)
-A3B, -A22BMoE 활성 파라미터
-Reasoning, -Thinking, -R1추론 모델
-VL, -Vision이미지 입력
-Omni다중 모달
-128K, -1M컨텍스트 길이
-Uncensored, -Abliterated안전장치 제거 (위험)
-2507출시 연월 (YYMM)

11.11 30초 해독 절차

이름이 길고 무서워 보이면 왼쪽부터 한 토막씩 끊어 읽으세요.

[소유자] / [시리즈]-[버전]-[크기]-[유형]-[특수]-[양자화].[포맷]

읽어가며 머리에 떠올릴 질문:

  1. 누가 올렸나? (원본/양자화 배포자)
  2. 어떤 시리즈인가? (Qwen, Llama, …)
  3. 몇 B인가? (메모리 계산용 — 4장)
  4. 무슨 용도인가? (Instruct? Vision? Reasoning?)
  5. 특수 기법? (Distill, MoE A_B, Thinking?)
  6. 양자화? (Q4_K_M 등 — 5장)
  7. 포맷? (GGUF / MLX / Safetensors — 10장)

11.12 실전 — 모르는 이름 만났을 때

이 책에 안 나온 이름이 와도 당황하지 마세요.

Phi-4-mini-Reasoning-4B-Q4_K_M.gguf

해독:

  • Phi: Microsoft 시리즈
  • 4: 4세대
  • mini: 작은 버전
  • Reasoning: 추론 모델
  • 4B: 40억 파라미터
  • Q4_K_M: 4비트 양자화
  • gguf: GGUF 포맷

→ “Microsoft Phi 4세대 소형 추론 모델, 40억 파라미터, 4비트 양자화 GGUF”

이 정도 추론이 30초 안에 되면 이 책 1부·2부가 잘 들어온 겁니다.


이 장에서 기억할 한 가지

모델 이름은 7개 필드의 조립체: 시리즈 / 버전 / 크기 / 유형 / 특수 / 양자화 / 포맷.

왼쪽부터 토막내서 읽으면 모르는 이름도 거의 다 풀립니다.


손으로 해볼 것

다음 모델 이름을 각각 해독해보세요. 답은 모델 카드를 열어보면 확인할 수 있습니다.

  1. Qwen3-14B-Instruct
  2. mistralai/Mixtral-8x7B-Instruct-v0.1
  3. unsloth/DeepSeek-R1-Distill-Qwen-14B-GGUF
  4. mlx-community/Llama-3.3-70B-Instruct-4bit
  5. bartowski/Qwen2.5-Coder-32B-Instruct-Q5_K_L.gguf

처음에는 답이 안 나와도 좋습니다. 3개 정도부터 막힐 텐데, 3장(파라미터), 9장(유형), 10장(포맷), 14장(MoE) 을 다시 한 번씩 펼쳐보세요.


다음 장에서는 라이선스 를 정면으로 봅니다.

“이 모델 회사에서 써도 되는 거 맞아?” 라는 질문에 답할 수 있게 됩니다.